Co-classification sous contraintes par la somme des résidus quadratiques

نویسندگان

  • Ruggero G. Pensa
  • Jean-François Boulicaut
چکیده

Résumé. Dans de nombreuses applications, une co-classification est plus facile à interpréter qu’une classification mono-dimensionnelle. Il s’agit de calculer une bi-partition ou collection de co-clusters : chaque co-cluster est un groupe d’objets associé à un groupe d’attributs et les interprétations peuvent s’appuyer naturellement sur ces associations. Pour exploiter la connaissance du domaine et ainsi améliorer la pertinence des partitions, plusieurs méthodes de classification sous contraintes ont été proposées pour le cas mono-dimensionnel, e.g., l’exploitation de contraintes "must-link" et "cannot-link". Nous considérons ici la co-classification sous contraintes avec la gestion de telles contraintes étendues aux dimensions des objets et des attributs, mais aussi l’expression de contraintes de contiguité dans le cas de domaines ordonnés. Nous proposons un algorithme itératif qui minimise la somme des résidus quadratiques et permet l’exploitation active des contraintes spécifiées par les analystes. Nous montrons la valeur ajoutée de ce type d’extraction sur deux applications en analyse du transcriptome.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Acquisition des contraintes ouvertes par apprentissage de solveurs

Résumé : Nous présentons une technique d’apprentissage d’un objet très particulier qui est un solveur de contraintes. Étant donné un sous-ensemble de solutions et un autre sous-ensemble de non-solutions pour une contrainte, nous cherchons une représentation de la contrainte entière sous la forme d’un solveur. Un solveur permet de distinguer les solutions des non-solutions, et ainsi il effectue ...

متن کامل

Une approche en programmation par contraintes pour la classification non supervisée

Résumé. Dans cet article, nous abordons le problème de classification non supervisée sous contraintes fondé sur la programmation par contraintes (PPC). Nous considérons comme critère d’optimisation la minimisation du diamètre maximal des clusters. Nous proposons un modèle pour cette tâche en PPC et nous montrons aussi l’importance des stratégies de recherche pour améliorer son efficacité. Notre...

متن کامل

A Toric Ring with Irrational Poincar E-betti Series

{ We show that there exists a toric curve in P 8 , whose homogeneous coordinate ring has a presentation with 12 quadratic relations and whose Poincar e-Betti series is irrational. The example was found by a computer search, aiming at a homological classiication of those toric curves that have a quadratic presentation in P n?1 for n 9. Some other consequences of this search are also presented. U...

متن کامل

Extraction sous contraintes d'ensembles de cliques homogènes

Résumé. Nous proposons une méthode de fouille de données sur des graphes ayant un ensemble d’étiquettes associé à chaque sommet. Une application est, par exemple, d’analyser un réseau social de chercheurs co-auteurs lorsque des étiquettes précisent les conférences dans lesquelles ils publient. Nous définissons l’extraction sous contraintes d’ensembles de cliques tel que chaque sommet des clique...

متن کامل

Génération de contraintes pour le clustering à partir d'une ontologie - Application à la classification d'images satellites

Résumé. L’utilisation des connaissances a priori peut fortement améliorer la classification non-supervisée. L’injection de ces connaissances sous forme de contraintes sur les données figure parmi les techniques les plus efficaces de la littérature. Cependant, la génération des contraintes est très coûteuse et demande l’intervention de l’expert ; la sémantique apportée par l’étiquetage de l’expe...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008